分享人:朱英杰
目录
1.背景介绍
2.知识剖析
3.编码实战
4.扩展思考
5.参考文献
微格式:建立在已有的、被广泛采用的标准基础之上的一组简单的、开放的数据格式 (microformats.org官方定义)。是把语义嵌入到HTML以便有助于分离式开发而 制定的一些简单约定,是兼顾人机可读性设计的数据表达方式,对Web网页进行语义注解的方法。 这种方法依托于标准的Web页面写作技术,例如,XHTML,这样引入语义信息对浏览器等所有现存 的Web技术冲击最小。采用Microformat的 Web页面,在XHTML文档中给一些标签(Tag)增加一些属性 (attribute),这些属性对信息的语义结构进行注解,处理XHTML文档的软件,例如,浏览器等, 如果不认识这些属性可以跳过,并不造成任何不良影响(ITPUB) 简单点说:通过语意相关让内容人机可读
网页上的允许的微格式数据包括事件、人物、地点等,它可以被其他的软件检测到,并提取出相应的信息,以及对信息进行索引、搜索、跨平台的参考,把这些信息以其他形式重复使用或组合。目前已具备完整规范的微格式还包括:hCard、hCalendar、XOXO、XFN、VoteLinks和3个“rel-”微格式:rel- license、rel-nofollow和rel-tag。
北京:39.90556;116.39139
简单的微格式
我们从上面的描述知道,微格式实际就是为现有的(X)HTML元素添加元数据
和其他属性,增强语义。那么我们就来看一个简单的微格式应用吧。
以前我们是这样写一个链接到首页的代码的:
Web Design Blog
而现在我们要为这个代码元素a加上rel属性。
Web Design Blog
上面的链接标记的a标签包括rel=”home”属性,该属性显示链接的目标页面是该网站的首页。
通过为已有的链接元素添加语义化属性,就为这个链接添加了具体的结构和意义。
微格式在实际应用中的意义和作用又是什么呢?
在爬取Web内容时,能够更为准确地识别内容块的语义;
对内容进行操作,包括提供访问、校对,还可以将其转化成其他的相关格式,提供给外部程序和Web服务使用。
参考一:博客
Microformat有效地在Web文档中增加语义信息,然而,现有Web上的海量信息 全部改造成符合该标准的内容显然是不现实的,一种替代方法就是给现有的互联网内容增加一个 语义描述层,这一层可以独立于原信息页面进行建设,MetaSeeker工具包是这类解决方案的佼佼者。
感谢大家观看
BY : 李博宇-邓杰仁-朱英杰